Invalid Date
Orange 是一个可视化的拖放式工具,用于
等等。你可以从这里下载和安装 Orange:
让我们用 Orange 创建一些简单的可视化。
文件小部件 将 iris 数据集导入到你的会话中数据表小部件 查看数据,并注意其变量名可视化小部件(散点图、柱状图和分布图)查看变量的属性,并检查它们之间的关系。在绘制单个图表之前,最好先查看一些汇总所考虑数据集的数字。这些可能是什么?一些明显有用的数字是:
Auto MPG特征统计 小部件数据集 小部件连接到 特征统计 小部件在夏洛克·福尔摩斯的故事《跳舞的人》中,一个角色认识的罪犯使用像这样的孩子气/稚嫩的图画与她交流:
| 变量 #1 | 变量 #2 | 图表名称 | 图表形状 |
|---|---|---|---|
| 定性 | 无 | 柱状图 |
Author:书籍作者(定性)Title:书名(定性)Origin:挑战来源(定性)Type of Ban:书籍禁令类型(定性)State:书籍被禁的州(定性)District:书籍被禁的地区(定性)Origin:挑战来源(定性)研究问题
对书籍实施的禁令有哪些类型?每种禁令类型禁了多少本书?
这里的故事是什么?
定性变量
year:出生年份(定性)month:一年中的月份(定性)day_of_month:月份中的日子(定性)day_of_week:一周中的日子(定性)定量变量
births:当天的出生数量(定量)day_of_week 着色,我们可以看到出生数量如何在一周的日子里变化。t 检验 / 方差分析 会告诉我们这是否属实。t 检验和方差分析报告。让我们使用 Orange 中的 数据集 小部件获取 titanic 数据。
根据此数据集,有 2201 名乘客。
让我们在 Orange 中使用预设的工作流
titanic| 变量 #1 | 变量 #2 | 图表名称 | 图表形状 |
|---|---|---|---|
| 定性 | 定性 |
这里,area \sim count,所以图块的面积与该图块中的观察值计数成比例。
Note
头等舱,杰克乘坐三等舱。所以几率再次对他不利。当实际计数与预期计数之间的差异很大时,我们推断一个定性变量对另一个定性变量有影响。(从计数角度或比率角度)
| 弹膛 | 子弹 |
|---|---|
| 1 | Y / N |
| 2 | Y / N |
| .. | … |
| 6 | Y / N |
那么加巴尔的假设呢?
在美国,种族(通过名字揭示)是否是种族歧视的基础?
此数据集是由玛丽安·伯特兰和森蒂尔·穆拉伊纳森进行的一项里程碑式研究的一部分生成的。
阅读其中的描述,以真正了解如何通过精心设计的研究实验来证明因果关系。
afam 和 cauc 的电话百分比似乎不同ethnicity 无关紧要并旋转左轮手枪!!ethnicity 无关紧要的零假设。afam 候选人受到歧视。| 加巴尔 | 统计学老师 |
|---|---|
| “有多少人?” | 你有多少观察值?n < 30 是个笑话。 |
| 你明白什么来的吗?加巴尔会高兴吗?会表扬吗? | 你的因子有哪些水平?它们是二元的吗?暂时不要做方差分析! |
| (开了三枪)是的,现在好了! | 是的,现在数据集相对于因子(处理和对照)是平衡的。 |
| 这把手枪里有三条命和三条死。看看谁得到什么。 | 这是我们的研究问题,我们将为此设计一个实验。 |
| 我们什么都不知道! | 让我们对此因子进行非参数排列检验! |
| 太棒了! | 太棒了!我们的 p 值太小,可以拒绝零假设!! |
Arvind V.| VizChitra2025 | 2025年6月